Публикации с тэгом "Resource Description Framework"
СТАТЬЯ Named Entity Recognition for Dummies
Введение Named Entity Recognition (извлечение сущностей) – это одна из задач text mining, суть которой состоит в автоматическом определении сущностей в неструктурированных тестовых данных. Классическими сущностями выступают имена людей и компаний (names), адреса (locations), географические объекты (locations), даты (dates) и, в более сложных случаях, связи между ними, а также события, причинно-следственные связи, хронометраж событий. Также можно добавить к этому списку такие сущности, как электр...
СТАТЬЯ Семантический HTML5. Часть 1
Когда пользователь заходит на веб-сайт, он видит кросиво оформленные веб-страницы, графику, информационные блоки, стили и легко может определить основной контент от рекламы. Поисковые машины и роботы видят все страницы одинаково – для них это все лишь набор HTML текста. Таким образом, восприятие и обработка информации человеком и машиной отличается. Но когда разработчик сайта делает свой сайт, то, скорее всего, он хочет, чтобы его детище воспринималось всеми одинаково. К сожалению, на практике э...
СТАТЬЯ Извлечение данных из веб-ресурсов
Содержание серии статей под общим названием "Извлечение данных из веб-ресурсов". Введение 1. Форматы представления данных в вебе XML, RDF / OWL / SPARQL, RSS / Atom / OPML. (ASP.NET RSS Toolkit) Формат CSV Формат JSON Формат OData 2. Подходы к извлечению данных из веб-ресурсов Семантические элементы HTML5 Регулярные выражения и парсинг XML, aнализ DOM дерева, визуальный подход 3. User Agents Введение Война браузеров или Что делает "Mozilla" в Internet Explorer User Agent? User Agent Style Sheets...
СТАТЬЯ Внедрение семантических данных в HTML
Тоже хочу принять участие в размышлениях на тему семантического веба, начатого здесь и здесь. Мной было потрачено определенное количество времени на исследования принципов и тенденций развития семантического веба, хочу поделиться основными результатами и мыслями. Зачем мне это нужно? Ответ очень простой — необходимость отделять зерна от плевел, т.е. «информацию» от «информационного шума». Как это может качественно повлиять на веб: если ввести в поисковую систему запрос, содержащий название неког...
СТАТЬЯ Codeplex: ленты новостей с ASP.NET RSS Toolkit
В продолжении серии постов об интересных проектах с сайта Codeplex кратко расскажу о ASP.NET RSS Toolkit. Проект достаточно немолодой - начиналось все в 2006 году, в июле 2007 было обновление до версии 2.0, которая является основной и сейчас. Основные возможности: Контрол RssDataSource для отображения фидов на своих сайта. Работает с ASP.NET data-bound контролами. Автогенерация столбцов в рантайме. Кэширование загруженых фидов в памяти и на жесткий диск. Генерация своих фидов в формате RSS, Atom...
СТАТЬЯ LINQ to ...
Офіційні: LINQ to SQL (DLINQ) LINQ to XML (XLINQ) LINQ to XSD LINQ to Entities BLINQ PLINQ Неофіційні: LINQ to Amazon LINQ to Active Directory LINQ to Bindable Sources (SyncLINQ) LINQ to C# project LINQ to Continuous Data (CLinq) LINQ to CRM LINQ To Geo - Language Integrated Query for Geospatial Data LINQ to Excel LINQ to Expressions (MetaLinq) LINQ Extender (Toolkit for building LINQ Providers) LINQ to Flickr LINQ to Google LINQ to Indexes (LINQ and i40) LINQ to IQueryable (Matt Warren on Provi...